热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

书单|数据挖掘,你不应该错过的六本书

来源|微软研究院AI头条不久前我们推出的《推荐算法不够精准?让知识图谱来解决》以及《如何将知识图谱特征学习应用到推荐系统?》系列文章受到了同学们的广泛欢

640?wx_fmt=jpeg


来源 | 微软研究院AI头条


不久前我们推出的《推荐算法不够精准?让知识图谱来解决》以及《如何将知识图谱特征学习应用到推荐系统?》系列文章受到了同学们的广泛欢迎。大家对推荐系统以及与之相关的、底层的数据挖掘技术非常关注。


为了帮助小伙伴们更好地学习相关内容,我们邀请微软亚洲研究院社会计算组研究员张富峥为大家推荐了六本数据挖掘领域的经典书籍,既涵盖了数据挖掘的概念、算法等基础知识,又包含了数据挖掘在不同子领域的具体应用。一起来看看吧!


一、基础篇



主要目标:帮助大家了解数据挖掘领域的基本概念、代表性算法和评估技术,比如数据的关联分析、分类及聚类算法等,为大家之后进一步学习数据挖掘知识、深入进行科研或在实际场景中应用奠定基础。


1. Introduction to Data Mining


作者:Pang-Ning Tang、Michael Steinbach、Vipin Kumar

中文译名:数据挖掘导论(完整版)

适合人群:初级到中级学者

推荐指数:★★★★★


640?wx_fmt=jpeg


主要内容:本书内容涵盖了数据挖掘的方方面面,从什么是数据挖掘、什么是数据以及数据预处理的方法,到具体的数据挖掘算法,比如分类、关联分析、聚类、异常检测等,从基本的定义入手,由浅至深地帮助读者透彻地理解数据挖掘的基础。书中使用大量的图表、综合示例、关键算法的简洁描述等,尽可能地直接聚焦于数据挖掘的主要概念。


推荐理由:本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,是数据挖掘领域经典的入门教程。本书内容浅显易懂,只要求具备很少的统计学或数学背景知识,略去了各个定理的证明部分,通过枚举大量具体的算法实例来简要说明算法的流程和意义,让初学者可以以最快速度总揽全局,掌握数据挖掘领域的基本要点。


2. Data Mining: Concepts and Techniques


作者:Jiawei Han、Micheline Kamber、Jian Pei

中文译名:数据挖掘:概念与技术(原书第三版)

适合人群:初级到中级学者

推荐指数:★★★★★


640?wx_fmt=jpeg


主要内容:本书是最新的第三版,主要从数据库角度全面系统地介绍了数据挖掘的基本概念、方法、技术以及技术的研究进展,并且重点关注了数据挖掘领域最新的技术和发展,介绍了社会网络挖掘、流数据挖掘和数据立方体计算等最新的研究方法,并探讨了数据挖掘方法在金融等领域的应用。书中引入了许多算法和实现实例,以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。


推荐理由:本书是一本非常优秀的数据挖掘教材,更是数据挖掘领域具有里程碑意义的经典著作。它不仅详尽讲述了数据挖掘的基本概念和方法,又具有一定的深度,介绍了数据挖掘领域近年来最新的课题。它结构合理、调理清晰,每一章都针对关键专题有单独的指导,并且只要求读者具备少量的编程经验以及了解基本的数据和统计分析方向的知识。



二、 应用篇



主要目标: 在大数据时代,数据的形式多种多样,在不同科研领域、商业背景、产业类型中的应用也十分丰富。这里我们通过四本书来为大家介绍数据挖掘的方法和思想在三个不同的子领域中的具体应用,帮助大家了解数据挖掘领域最前沿的热门研究方向和应用场景,为大家把握科研或工程的方向提供参考


1. Recommender Systems: An introduction


作者:Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich

中文译名:推荐系统

适合人群:中级到高级学者

推荐指数:★★★★★


640?wx_fmt=jpeg


主要内容:本书比较全面地介绍了推荐系统涉及的相关知识点,呈现了许多经典算法,并讨论了如何衡量推荐系统的有效性。书中内容分为基本概念和最新进展两部分:前者涉及协同推荐、基于内容的推荐、基于知识的推荐、混合推荐方法,推荐系统的解释、评估推荐系统和实例分析;后者包括针对推荐系统的攻击、在线消费决策、推荐系统和下一代互联网以及普适环境中的推荐。


推荐理由:本书内容详尽,广泛涵盖了不同类型的推荐系统,并对这些推荐系统逐一进行了细致地剖析,并辅以实际应用案例的介绍,适合想要了解推荐系统的基础和相关研究的读者作为推荐系统的入门书籍。书中包含了大量的图、表以及示例,有助于读者理解和把握相关知识。

 

2. Recommender Systems: The Textbook


作者:Charu C. Aggarwal

适合人群:中级到高级学者

推荐指数:★★★★☆


640?wx_fmt=jpeg


主要内容:本书详尽地介绍了推荐系统的方方面面,可以大致地被分为三个部分:“算法和评估”部分探讨了推荐系统中的基础算法,包括协同过滤的方法、基于内容的方法、基于知识的方法、集成方法以及推荐系统的评估方法;“特定领域和上下文下的推荐系统”部分介绍在如时间空间数据、社交数据、标签数据以及信用度数据等不同的上下文场景数据中如何进行推荐;“高级的主题和应用”部分介绍了和推荐系统的鲁棒性相关的内容,如先令系统、攻击模型以及相应的防御模型。


推荐理由:这是一本非常优秀的推荐系统教科书,它不仅用简单的语言阐述了推荐系统的基础,深入地介绍了核心算法的概念以及数学论证,还为读者提供了第三方工具或框架使用时需要查询的大量资料。它对于推荐系统的基础、具体应用和相关文献进行了全面介绍,既适合研究人员作为推荐系统的入门书籍,又适合工业从业人员作为工具参考书。

 

3. Sentiment Analysis: Mining Opinions, Sentiments,and Emotions


作者:Bing Liu

中文译名:情感分析:挖掘观点、情感和情绪

适合人群:中级到高级学者

推荐指数:★★★★★


640?wx_fmt=jpeg


主要内容:本书主要从自然语言处理的角度全面地介绍情感分析这个主题中的基础算法以及先进的研究技术和科研结果。书中几乎涵盖了情感分析所有的核心领域,在介绍了情感分析的基本概念和多种基本的情感分析场景后,又解读了多个新兴的情感分析主题,比如辩论分析、意图挖掘、假民意检测等,不仅能够让读者了解通常用于表达观点和情感的问题和语言的基本结构,还能帮助读者深入地探究大量观点挖掘和情感分析的算法和系统。


推荐理由:本书是迄今为止观点挖掘与情感分析领域最权威、最全面的著作之一。书中几乎涵盖了情感分析的方方面面,将理论和实践相结合,深入浅出,同时兼顾了领域知识的深度和广度,不仅可以作为刚接触这一领域的学者或开发者的入门教材,又可以作为了解这一领域最前沿研究成果的经典读物。

 

4. 移动数据挖掘


作者:连德富、张富峥、王英子、袁晶、谢幸

适合人群:中级到高级学者

推荐指数:★★★★★


640?wx_fmt=jpeg


主要内容:本书选取当前学术界和工业界的热点为主题,自成体系,书中以人的轨迹数据,特别是移动社交网络的位置数据为中心,结合人的基本信息及社交网络等相关信息来研究个人与群体的移动模式特性,介绍了移动数据挖掘的基本概念和方法,具体包括移动数据预处理、用户移动模型、用户画像以及兴趣位置推荐等,内容十分新颖。


推荐理由:本书是大数据管理丛书中的一本,书中梳理总结了作者团队过去十年在人群移动数据理解上展开的研究,这些研究经验不仅对于很多实际应用有着重要的价值,也有助于解决一些具有社会意义的科学问题。本书在介绍了移动数据的概念及其价值的同时,还细致地讲解了移动数据领域内的多个前沿研究课题,对于想要深入了解这个领域的学者和工业从业人员是非常好的选择。


看完了书单,还不赶紧挑选几本!


欢迎大家在下方留言区留言,分享你心目中数据挖掘的经典书籍。


你还需要哪个领域的书单呢?也欢迎在留言区告诉我们!


——【完】——


AI公开课精彩预告

时间:6月28日 20:00-21:00

扫描海报二维码,免费报名

添加微信csdnai,备注:公开课,加入课程交流群



推荐阅读
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • Android源码中的Builder模式及其作用
    本文主要解释了什么是Builder模式以及其作用,并结合Android源码来分析Builder模式的实现。Builder模式是将产品的设计、表示和构建进行分离,通过引入建造者角色,简化了构建复杂产品的流程,并且使得产品的构建可以灵活适应变化。使用Builder模式可以解决开发者需要关注产品表示和构建步骤的问题,并且当构建流程发生变化时,无需修改代码即可适配新的构建流程。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • OpenMap教程4 – 图层概述
    本文介绍了OpenMap教程4中关于地图图层的内容,包括将ShapeLayer添加到MapBean中的方法,OpenMap支持的图层类型以及使用BufferedLayer创建图像的MapBean。此外,还介绍了Layer背景标志的作用和OMGraphicHandlerLayer的基础层类。 ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
author-avatar
值兰修女_662
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有